智能论文笔记

Sparse high-dimensional linear regression with a partitioned empirical Bayes ECM algorithm

Alexander C. McLain , Anja Zgodic , Howard Bondell

分类： (统计)机器学习

2022-09-16

贝叶斯变量选择方法是适合和推断稀疏高维线性回归模型的强大技术。但是，许多在计算密集型上或需要对模型参数进行限制性的先验分布。基于可能性的惩罚方法在计算方面更友好，但是推理需要资源密集型的改装技术。在本文中，我们提出了一种有效而强大的贝叶斯方法，用于稀疏高维线性回归。通过使用插件的经验贝叶斯估算超参数的估计值，需要对参数的最小化假设。有效的最大后验概率（MAP）估计是通过使用分区和扩展期望最大化（ECM）算法完成的。结果是应用于稀疏高维线性回归的经验贝叶斯ECM（探针）算法。我们提出了估计未来价值预测的可靠和预测间隔的方法。我们将预测的经验特性和我们的预测推断与可比方法进行了比较，并通过大量的模拟研究和对癌细胞系药物反应研究的分析进行了比较。提出的方法在R软件包探针中实现。

translated by 谷歌翻译

Deep Learning Generates Synthetic Cancer Histology for Explainability and Education

James M. Dolezal , Rachelle Wolk , Hanna M. Hieromnimon , Frederick M. Howard , Andrew Srisuwananukorn , Dmitry Karpeyev , Siddhi Ramesh , Sara Kochanny , Jung Woo Kwon , Meghana Agni

分类：计算机视觉

2022-11-12

Artificial intelligence methods including deep neural networks (DNN) can provide rapid molecular classification of tumors from routine histology with accuracy that matches or exceeds human pathologists. Discerning how neural networks make their predictions remains a significant challenge, but explainability tools help provide insights into what models have learned when corresponding histologic features are poorly defined. Here, we present a method for improving explainability of DNN models using synthetic histology generated by a conditional generative adversarial network (cGAN). We show that cGANs generate high-quality synthetic histology images that can be leveraged for explaining DNN models trained to classify molecularly-subtyped tumors, exposing histologic features associated with molecular state. Fine-tuning synthetic histology through class and layer blending illustrates nuanced morphologic differences between tumor subtypes. Finally, we demonstrate the use of synthetic histology for augmenting pathologist-in-training education, showing that these intuitive visualizations can reinforce and improve understanding of histologic manifestations of tumor biology.

translated by 谷歌翻译

An Experiment Design Paradigm using Joint Feature Selection and Task Optimization

Stefano B. Blumberg , Hongxiang Lin , Yukun Zhou , Paddy Slator , Daniel C. Alexander

分类：机器学习 | 人工智能

2022-10-13

This paper presents a subsampling-task paradigm for data-driven task-specific experiment design (ED) and a novel method in populationwide supervised feature selection (FS). Optimal ED, the choice of sampling points under constraints of limited acquisition-time, arises in a wide variety of scientific and engineering contexts. However the continuous optimization used in classical approaches depend on a-priori parameter choices and challenging non-convex optimization landscapes. This paper proposes to replace this strategy with a subsampling-task paradigm, analogous to populationwide supervised FS. In particular, we introduce JOFSTO, which performs JOint Feature Selection and Task Optimization. JOFSTO jointly optimizes two coupled networks: one for feature scoring, which provides the ED, the other for execution of a downstream task or process. Unlike most FS problems, e.g. selecting protein expressions for classification, ED problems typically select from highly correlated globally informative candidates rather than seeking a small number of highly informative features among many uninformative features. JOFSTO's construction efficiently identifies potentially correlated, but effective subsets and returns a trained task network. We demonstrate the approach using parameter estimation and mapping problems in clinically-relevant applications in quantitative MRI and in hyperspectral imaging. Results from simulations and empirical data show the subsampling-task paradigm strongly outperforms classical ED, and within our paradigm, JOFSTO outperforms state-of-the-art supervised FS techniques. JOFSTO extends immediately to wider image-based ED problems and other scenarios where the design must be specified globally across large numbers of acquisitions. Code will be released.

translated by 谷歌翻译

Understanding Collapse in Non-Contrastive Learning

Alexander C. Li , Alexei A. Efros , Deepak Pathak

分类：机器学习 | 人工智能 | 计算机视觉 | 神经与进化计算 | 机器人

2022-09-29

对比方法导致了最近的自我监督表示学习（SSL）的表现激增。诸如BYOL或SIMSIAM之类的最新方法据称将这些对比方法提炼为它们的本质，消除了钟声和哨子，包括负面示例，这些示例不影响下游性能。这些“非对比度”方法的工作非常出色，而无需使用负面因素，即使全球最低限度的崩溃都在淡化。我们通过经验分析了这些非对抗性方法，发现Simsiam对数据集和模型大小非常敏感。特别是，如果模型相对于数据集大小而言太小，则SIMSIAM表示会经历部分维度崩溃。我们提出了一个度量标准来测量这种崩溃的程度，并表明它可以用于预测下游任务性能，而无需任何微调或标签。我们进一步分析建筑设计选择及其对下游性能的影响。最后，我们证明，转移到持续的学习设置充当正规化器并防止崩溃，并且在Imagenet上使用Resnet-18，连续和多上述训练之间的混合物可以提高线性探针精度多达18个百分点。

translated by 谷歌翻译

Elastic Context: Encoding Elasticity for Data-driven Models of Textiles

Alberta Longhini , Marco Moletta , Alfredo Reichlin , Michael C. Welle , Alexander Kravberg , Yufei Wang , David Held , Zackory Erickson , Danica Kragic

分类：机器人

2022-09-12

与纺织品（例如辅助敷料）的物理互动依赖于先进的灵巧能力。拉扯和拉伸时纺织行为的潜在复杂性是由于纱线材料特性和纺织品构造技术所致。如今，还没有采用和注释的数据集评估各种交互或属性识别方法。影响这种相互作用的一种重要特性是材料弹性是由纱线材料和构造技术引起的：这两个是交织在一起的，如果不知道A-Priori，几乎无法通过在机器人平台上使用常见的传感来识别。我们介绍了弹性环境（EC），该概念集成了影响弹性行为的各种属性，以使其与纺织品进行更有效的物理互动。 EC的定义依赖于纺织工程中常用的压力/应变曲线，我们为机器人应用重新制定了压力/应变曲线。我们使用图形神经网络（GNN）使用EC来学习纺织品的通用弹性行为。此外，我们探讨了EC对非线性现实世界弹性行为的准确力量建模的影响，从而强调了当前机器人设置以感知纺织特性的挑战。

translated by 谷歌翻译

Continual learning benefits from multiple sleep mechanisms: NREM, REM, and Synaptic Downscaling

Brian S. Robinson , Clare W. Lau , Alexander New , Shane M. Nichols , Erik C. Johnson , Michael Wolmetz , William G. Coon

分类：神经与进化计算 | 机器学习

2022-09-09

在不失去先前学习的情况下学习新任务和技能（即灾难性遗忘）是人为和生物神经网络的计算挑战，但是人工系统努力与其生物学类似物达成平等。哺乳动物的大脑采用众多神经手术来支持睡眠期间的持续学习。这些是人工适应的成熟。在这里，我们研究了建模哺乳动物睡眠的三个不同组成部分如何影响人工神经网络中的持续学习：（1）在非比型眼运动（NREM）睡眠期间观察到的垂直记忆重播过程；（2）链接到REM睡眠的生成记忆重播过程；（3）已提出的突触降压过程，以调整信噪比和支持神经保养。在评估持续学习CIFAR-100图像分类基准上的性能时，我们发现将所有三个睡眠组件的包含在内。在以后的任务期间，训练和灾难性遗忘在训练过程中提高了最高准确性。尽管某些灾难性遗忘在网络培训过程中持续存在，但更高水平的突触缩减水平会导致更好地保留早期任务，并进一步促进随后培训期间早期任务准确性的恢复。一个关键的要点是，在考虑使用突触缩小范围的水平时，手头有一个权衡 - 更具侵略性的缩减更好地保护早期任务，但较少的缩减可以增强学习新任务的能力。中级水平可以在训练过程中与最高的总体精度达到平衡。总体而言，我们的结果都提供了有关如何适应睡眠组件以增强人工连续学习系统的洞察力，并突出了未来神经科学睡眠研究的领域，以进一步进一步进行此类系统。

translated by 谷歌翻译

PercentMatch: Percentile-based Dynamic Thresholding for Multi-Label Semi-Supervised Classification

Junxiang Huang , Alexander Huang , Beatriz C. Guerra , Yen-Yun Yu

分类：计算机视觉

2022-08-30

尽管半监督学习（SSL）的最新研究已经在单标签分类问题上取得了强劲的表现，但同样重要但毫无疑问的问题是如何利用多标签分类任务中未标记数据的优势。为了将SSL的成功扩展到多标签分类，我们首先使用说明性示例进行分析，以获得有关多标签分类中存在的额外挑战的一些直觉。基于分析，我们提出了一个基于百分比的阈值调整方案的百分位摩擦，以动态地改变训练期间每个类别的正和负伪标签的得分阈值，以及动态的未标记失误权重，从而进一步降低了从早期未标记的预测。与最近的SSL方法相比，在不丧失简单性的情况下，我们在Pascal VOC2007和MS-Coco数据集上实现了强劲的性能。

translated by 谷歌翻译

Semi-Supervised Manifold Learning with Complexity Decoupled Chart Autoencoders

Stefan C. Schonsheck , Scott Mahan , Timo Klock , Alexander Cloninger , Rongjie Lai

分类：机器学习

2022-08-22

自动编码是表示学习的一种流行方法。常规的自动编码器采用对称编码编码程序和简单的欧几里得潜在空间，以无监督的方式检测隐藏的低维结构。这项工作介绍了一个图表自动编码器，其中具有不对称编码编码过程，该过程可以包含其他半监督信息，例如类标签。除了增强使用复杂的拓扑结构和几何结构处理数据的能力外，这些模型还可以成功区分附近的数据，但仅与少量监督相交并与歧管相交。此外，该模型仅需要较低的复杂性编码器，例如局部线性投影。我们讨论了此类网络的理论近似能力，基本上取决于数据歧管的固有维度，而不是观测值的维度。我们对合成和现实世界数据的数值实验验证了所提出的模型可以有效地通过附近的多类，但分离不同类别，重叠的歧管和具有非平凡拓扑的歧管的数据。

translated by 谷歌翻译

Optimising Chest X-Rays for Image Analysis by Identifying and Removing Confounding Factors

Shahab Aslani , Watjana Lilaonitkul , Vaishnavi Gnanananthan , Divya Raj , Bojidar Rangelov , Alexandra L Young , Yipeng Hu , Paul Taylor , Daniel C Alexander , Joseph Jacob

分类：计算机视觉 | 机器学习

2022-08-22

在COVID-19大流行期间，在COVID-19诊断的紧急环境中进行的大量成像量导致临床CXR获取的差异很大。在所使用的CXR投影，添加图像注释以及临床图像的旋转程度和旋转程度中可以看到这种变化。图像分析社区试图通过开发自动化的CoVID-19诊断算法来减轻大流行期间过度拉伸放射学部门的负担，该诊断算法是CXR成像的输入。已利用大量公开的CXR数据集来改善CoVID-19诊断的深度学习算法。然而，公开可用数据集中临床可获得的CXR的可变质量可能会对算法性能产生深远的影响。 COVID-19可以通过图像标签等图像上的非动物特征的算法来推断诊断。这些成像快捷方式可能是数据集特定的，并限制了AI系统的概括性。因此，了解和纠正CXR图像中的关键潜在偏差是CXR图像分析之前的重要第一步。在这项研究中，我们提出了一种简单有效的逐步方法，以预处理Covid-19胸部X射线数据集以消除不希望的偏见。我们进行消融研究以显示每个单个步骤的影响。结果表明，使用我们提出的管道可以将基线共证检测算法的精度提高到13％。

translated by 谷歌翻译

Bayesian Pseudo Labels: Expectation Maximization for Robust and Efficient Semi-Supervised Segmentation

Mou-Cheng Xu , Yukun Zhou , Chen Jin , Marius de Groot , Daniel C. Alexander , Neil P. Oxtoby , Yipeng Hu , Joseph Jacob

分类：计算机视觉 | 人工智能 | 机器学习

2022-08-08

本文涉及分割中的伪标记。我们的贡献是四倍。首先，我们提出了伪标签的新表述，作为一种预期最大化（EM）算法，用于清晰的统计解释。其次，我们纯粹基于原始伪标记，即Segpl，提出了一种半监督的医学图像分割方法。我们证明，SEGPL是针对针对2D多级MRI MRI脑肿瘤分段任务和3D二进制CT肺部肺血管分段任务的半监督分割的最新一致性正则方法的竞争方法。与先前方法相比，SEGPL的简单性允许更少的计算成本。第三，我们证明了SEGPL的有效性可能源于其稳健性抵抗分布噪声和对抗性攻击。最后，在EM框架下，我们通过变异推理引入了SEGPL的概率概括，该推论学习了训练期间伪标记的动态阈值。我们表明，具有变异推理的SEGPL可以通过金标准方法深度集合在同步时执行不确定性估计。

translated by 谷歌翻译